__file__ = 'A04.py'
__author__ = 'Jerry Liu'
__date__ = '2016-04-13'

"""
    问题：你有一个目录，放了你一个月的日记，都是 txt，为了避免分词的问题，假设内容都是英文，请统计出你认为每篇日记最重要的词。
    常用库：Counter 列表的统计词频
"""

import re
from collections import Counter

def count(path):
    f = open(path, 'r')
    s = f.read()
    wcount = re.findall('[\S\w+\b]+', s)
    print(Counter(wcount).most_common(2))

if __name__ == '__main__':
    count('d:\\test.txt')
